Geocodificación de las bases de datos de los casos de dengue

Felipe Antonio Dzul Manzanilla

1 Introdución

La geocodificación en salud pública es el proceso de convertir los domicilios de residencia de los eventos de salud (casos de alguna enfermedad) en coordenadas geográficas no proyectadas como la latitud y la longitud. Para realizar este proceso Google ofrece el servicio de geocodificación a través de una clave API (API de Geocoding).

2 Objetivos

Describir brevemente la actividad de la geocodificación de las bases de datos de los casos de dengue.

3 Material y Métodos

Semanalmente, la base de datos de casos de dengue es accesada en el modulo de vectores del Sistena Nacional de Vigilancia Epidemiológica de la Dirección General de Epidemiologia de la Secretaria de Salud Federal.

La base es cargada en R & Rstudio con la finalidad de convertir las direcciones físicas de los domicilios de los casos probables y confirmados de dengue.

La base es almacenada y actualizada semanalmente en un archivo RData en una maquina local (la información nunca se sube) y los archivos sensibles unicamente es manejado por el Dr. Felipe Antonio Dzul Manzanilla.

Asi mismo la base de los casos geocodificados proporcionados en un archivo encriptado y es proporcionado con la finalidad de comprobar la actividad a Consejo Nacional de Humanidades, Ciencia y Tecnología (CONAHCYT).

Sin la base de casos de dengue geocodificados, no se podría análizar espacialmente, el hecho de agregarle a la base los datos de las coordenadas geográficas permite convertir la base de datos en una base de datos espaciales. Esta transformación permite realizar diferentes operaciones geográficas a la base espacial y adquiere propiedades para poderle hacer análisis espaciales.

La serie temporal analizada incluye desde el 2008 al 2024. Dada la naturaleza de la frecuencia de reporte semanal y el hecho que en país es endémico para la enfermedad, las bases de datos se actualizan semanal para identificar las transmisión activa y al final del año se actualizan para la identificación de la transmisión persistente atraves de los hotspots.

4 Material y Métodos

Las bases de datos geocodificados incluye 95611 registros de casos confirmados y los grupos de edad incluidos son menores de 12 años y mayores de 65 años. Las variables de la base son año, longitud y latitud.En la tabla 1 se muestras los casos geocodificados por año y en la figura 1 se proporciona la distribución de los casos geocodificados.

Data summary
Name xy
Number of rows 95611
Number of columns 3
Key NULL
_______________________
Column type frequency:
numeric 3
________________________
Group variables None

Variable type: numeric

skim_variable n_missing complete_rate mean sd p0 p25 p50 p75 p100 hist
ANO 0 1 2016.12 5.30 2008.00 2012.00 2016.00 2021.00 2024.00 ▇▇▅▆▇
long 0 1 -98.88 5.61 -118.28 -103.28 -99.20 -94.47 -86.73 ▁▂▇▇▃
lat 0 1 20.08 3.10 14.56 18.02 19.25 21.16 32.67 ▅▇▂▂▁
Tabla 1. Casos de Dengue Geocodificados por AÑO
year n longitud latitud
2008 4671 3859 3880
2009 8907 7178 7217
2010 5246 4043 4060
2011 2483 2150 2165
2012 7549 6250 6298
2013 9987 7892 7952
2014 4608 3871 3896
2015 3224 2942 2948
2016 6326 2870 2877
2017 2425 2241 2248
2018 3146 2650 2674
2019 7985 7186 7223
2020 5143 4633 4646
2021 1760 1615 1616
2022 3227 2740 2757
2023 5016 4279 4307
2024 13908 12081 12181

Figura 1. Distribución de los casos de dengue en México por año